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MOYENS POUR LE TRAITEMENT ET LE DIAGNOSTIC 
DE MALADIES NEURODEGENERATIVES 

La presente invention concerne des moyens pour 
le traitement et le diagnostic de maladies 
neurodegeneratives. Elle concerne plus particulierement 
1 1 utilisation d'un anticorps monoclonal capable de 
reconnaitre et d'inactiver les chaines homopolymeres de 
glutamines dans les proteines specif iquement associees a 
ces maladies. 

La presence de sequences repetees dans I'ADN 
est un phenomene connu. Ces sequences peuvent etre de 
differences natures comme des sequences signal ou 
enhancer. II peut egalement s'agir de sequences codant 
pour un hcmopcl ymere faisant partie d'une structure 
prcteique de plus grande taille. 

Dans le cas precis de la maladie de Huntington 
11 s'agit d'une sequence repetee de codcns CAG codant 
pour une chaine homopol ymere de glutamine 
(polyglutamine) . II a ete mcntre que cette sequence est 
bien exprimee dans les proteines tracuites. L 1 implication 
de ces proteines dans le declenchement ou le 
developpement de la maladie depend essent iellement du 
nombre de residus glutamine enchaines dans la proteine. 
Plus celui-ci est important plus la maladie sera severe 
et precoce . 

On a pour 1 ! instant denombre au moins cinq 
maladies neurodegeneratives humaines genetiques 

associees a la presence de ces chaines de residus 
glutamine : l'atrophie musculaire spino-bulbaire associee 
au chromosome X ou maladie de Kennedy, la maladie de 
Huntington dominante autosomale, I'ataxie 

spinocerebelleuse de type 1, l^atrcphie dentarorubral- 
pallidoiuysienne et I'ataxie spinocerebelleuse de type 3 
ou maladie de Machado- Joseph . Dans les genes codant pour 
les proteines responsables de ces maladies, le nombre de 
triplets CAG repetes est tres variable. Par exemple dans 
le gene responsable de la maladie de Huntington, ce 
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nombre varie, entre 10 . et 35 unites chez les sujets r.on 
attaints et de 37-40 jusqu'a 60-120 chez les aalades. De 
plus chez les malades, on observe une instability de ce 
nombre de repetitions d'une generation a 1' autre. Une 
explication a cette variability repose sur les phenomenes 
de recombinaison et replication se produisant lors des 
divisions cellulaires au cours de la gametogenese . Ces 
phenomenes peuvent soit conduire a une augmentation du 
nombre de repetitions soit, plus rarement, a une 
diminution. Dans la plupart des cas le nombre de triplets 
CAG augmente chez les descendants et I'on observe que 
cette amplification de taille se fait surtout sur les 
alleles paternels du gene concerne. Le nombre de 
recombinaisons subies par l'ADN lors de la spermatogenese 
est en effet plus eleve que celui des recombinaisons 
survenant lors de l'ovogenese. Ceci est du au nombre tres 
eleve de divisions survenant au cours de la 
spermatogenese . 

Une etude reaiisee au sein de plusieurs 
families atteintes de la maladie de Huntington, a permis 
de comparer sur plusieurs generations quelques parametres 
tels que la longueur de ces sequences repetees, 1 ' age 
auquel se developpe la maladie et la severite de celle- 
ci. Les resultats obtenus font apparaitre une correlation 
inverse entre le nombre de triplets CAG (determinant la 
longueur de la chaine polyglutamine ) d'une part et l'age 
d'apparition et la gravite des symptomes d'autre part. 
Ceci permet d'expliquer la plus grande precocite et la 
plus grande severite de ces maladies de generation en 
generation. 

A ce jour ii n'existe' aucun outil therapeutique 
pour le traitement de la maladie de Huntington et d'une 
maniere generale des maladies neurodegeneratives 
associees a une repetition de glutamine. 
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La presente invention a ainsi pour objet de 
proposer une methode de traitement de ces maladies. Elle 
est fondee sur 1 1 utilisation d 1 un anticorps capable de se 
fixer sur les formes pathogenes des proteines 
responsables des maladies associees a une repetition de 
glutamine . 

Plus precisement, la demanderesse s'est 
interessee a la caracterisation d'un systeme capable de 
se lier in vitro a des chaines polyglutamine dont la 
longueur correspond a celle presente dans les proteines 
responsables de maladies neurodegeneratives. Ceci l'a 
conduit a rechercher un anticorps monoclonal a meme de 
reconnaitre specif iquemenn les chaines polyglutamine 
contenant un nombre de residus superieur a 37 ce qui 
correspond a la valeur limite inferieure de la longueur 
de la chaine polyglutamine dans les proteines pathogenes. 

De maniere inattendue, la demanderesse a mis en 
evidence qu'un anticorps monoclonal specifique, 

l f anticorps monoclonal 1C2 (mAclC2r s'avere capable de 
discriminer les proteines pathogenes des proteines 
normales en fonction de la longueur de ieurs chaines 
polyglutamines respectives . 

L 1 anticorps monoclonal 1C2 est deja connu pour 
son affinite pour un facteur de transcription se liant 
aux sequences TATA ( TATA-binding protein : T3P) . Jusqu'a 
present le peptide LEEQQRQQQQQQ, localise a l'extremite 
N-terminale de la chaine homopolymere de glutamine de la 
TBP, etait considere comme 1' epitope pour lequel 
l 1 affinite de cet anticorps etait la plus importante 
(Lescure A et al . EMBO Journal 13, 1166-1175 (1995)). 

De maniere tout a fait surprenante la 
demanderesse a montre que cet anticorps possedait en fait 
une tres forte affinite pour les sequences polyglutamines 
meme en I 1 absence du peptide decrit ci-dessus. Cette 
affinite est, de plus, proportionnelle a ia longueur de 
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la chaine polyglutamine . Son af finite pour ces dernieres 
est d'autant plus importante que les chaines sont 
longues. Pour les chaines de longueur normaie elle est 
nulle pour un temps d 1 exposition normal a 1 f anticorps et 
tres faible si 1 1 on augmente cette duree. De ce fait 
I'anticorps 1C2 est capable de reconnaitre les longues 
chaines polyglutamines des alleles mutes des proteines 
responsabies de la maladie de Huntington et des ataxies 
spinocerebelleuses 1 et 3 comme epitope pathologique . 
Avantageusement, il permet le diagnostic precoce des 
sujets qui vont developper l f une de ces maladies ainsi 
que des families a risques qui expriment des proteines 
dont- la chaine polyglutamine comprend un nombre de 
residus a la limite du pathologique. 

L' anticorps monoclonal 1C2 reconnalt 

specif iquement les formes pathologiques des proteines 
pathogenes dans la maladie de Huntington et les maladies 
associees a une repetition de triplets. II peut etre 
utilise afin d ? inactiver specif iquement les formes 
pathogenes de ces proteines, la liaison de 1C2 pouvant 
entrainer 

- un changement de conformation de la proteine 
lui faisant perdre ses proprietes pathogenes, ou, 

- une plus grande sensibilite aux sys-t ernes de 
degradation aussi bien intracelluiaires 
qu f ext race llul aires . 

Un premier objet de la presente invention est 
par consequent 1 1 utilisation de l'anticorps 1C2 ou d f un 
fragment ou d'un derive de I'anticorps 1C2 pour la 
preparation d'une composition pharmaceutique destinee au 
traitement preventif ' ou curatif des maladies 
neurodegeneratives associees a une repetition de 

glutamine . 

Les .fragments ou derives d'anticorps sont par 
exemple les fragments Fab ou F(ab) , 2 / les regions VH ou 
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VL d'un anticorps ou encore des anticorps simple chaine 
(ScFv). comprenant une region VH liee a une region VL par 
un bras. Ce type de domaine est particulierement 
avantageux puisqu'il peut etre dirige contre toute 
molecule . 

Les anticorps, molecules de la super famille des 
immunoglobuliries, sont constitues de differentes chaines 

(2 lourdes (H) et 2 legeres (L) ) el les-memes composees de 
differents domaines (domaine variable (V) domaine de 
jonction (J), etc). Le fragment ou derive d'anticorps 
selon l f invention comprend au moins le site de liaison de 
l f anticorps aux sequences polyglutamines . Ce fragment 
peut etre soit le domaine variable d'une chaine legere 

(V L ) ou lourde (V H ) , eventuellement sous forme de 
fragment Fab ou F(ab')2 ou, pref erentieliement, sous 
forme d' anticorps simple chaine (ScFv) . Les anticorps 
simple chaine sont constitues d'un peptide correspondent 
au site de liaison de la region variable de la chaine 
legere d'un anticorps relie par un bras peptidique a un 
peptide correspondant au site de liaison de la region 
variable de la chaine lourde d 1 un anticorps. La 
construction de sequences d'acides nucleiques codant pour 
de tels anticorps modifies selon ■ 1' invention a ete 
decrite par exemple dans le brevet US 4 946 778 ou dans 
les demandes WO 94/02610, WO 94/29446. Ce type de 
molecule c'est-a-dire comprenant le site de liaison de la 
region variable de la chaine legere de 1' anticorps 1C2 
relie par un bras peptidique au site de liaison de £a 
region variable de la chaine lourde de I 1 anticorps 1C2, 
constitue egaiement un objet de la presente invention. 

Pour inactiver lesdites proteines pathogenes 
1' anticorps peut etre administre tel quel dans le systeme 
nerveux des patients, par voie stereotaxique . Dans ce cas 
1' anticorps sera dirige contre les molecules 
pathologiques produites par les cellules malades. La 
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fixation de l'anticorps entraine 1 ' inactivation de ces 
proteines, et entraine leur degradation et. permet aussi 
d'eviter leur accumulation a I'interieur ou l'exterieur 
des cellules, une des causes possibles de la maladie. Ces 
anticorps ou des fragments des ces anticorps peuvent 
egalement penetrer a I'interieur des cellules et ainsi 
inactiver les proteines qui ne sont pas secretees. lis 
sont particulierement avantageux pour le traitement des 
maladies telles que par exemple la maladie de Huntington, 
1 'ataxic spinocerebelleuse de type 1, 2 ou 3, 1'atrophie 
musculaire spino-bulbaire associee au chromosome X ou 
maladie de Kennedy, 1'atrophie dentarorubral- 
pallidoluysienne et 1'ataxie spinocerebelleuse autosomale 
dominante. 

Un autre mode d ' utilisation de l'anticorps 
consiste a le faire agir directement a I'interieur de la 
cellule. Pour ce faire on utilise les methodes connues de 
transfert de genes. Un mode particulier de realisation de 
1' invention consiste a faire exprimer dans les cellules 
du patient un acide nucleique codant pour l'anticorps 1C2 
ou pour un fragment ou derive l'anticorps 1C2 comme par 
exemple un fragment ScFv, de cet anticorps. 

La sequence d'acides nucleiques codant pour 
l'anticorps 1C2 ou un fragment ou un derive de 
l'anticorps 1C2 peut etre administree telle quelle, sous 
forme d'ADN nu selon la technique decrite dar.s la demande 
WO 90/11092. Elle peut egalement etre administree sous 
forme complexee, par exemple avec du DEAE-dextran (Pagano 
et al., J. Virol. I (1967) 891), avec ces proteines 
nucleaires (Kaneda et al., Science 243 (198S) 375), avec 
des lipides (Feigner et al., PNAS 84 (1987) 7413), sous 
forme de liposomes (Fraley et al., J Biol Chem. 255 
(1980) 10431), etc. Pref erentiellement , la sequence 
utilisee dans le cadre de 1' invention fait partie d'un 
vecteur. L'emploi d'un tel vecteur permet en effet 
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d'ameliorer 1 1 administration de 1 ' acide nucieique dans 
les cellules a trailer, et egalement d f augmenter sa 
stabiiite dans iesdites cellules/ ce qui permet d'obtenir 
un effet therapeutique durable. De plus, ii est possible 
d'introduire plusieurs sequences d' acide nucieique dans 
un meme vecteur, ce qui augmente egalement I'efficacite 
du trai tement . 

Le vecteur utilise peut etre d'origine diverse, 
des lors qu'il est capable de transformer les cellules 
animales, de preference les cellules humaines. Dans un 
mode prefere de mise en oeuvre de 1' invention, on utilise 
un vecteur viral, qui peut etre chois parmi les 
adenovirus, les retrovirus, les virus adeno-associes 
(AAV) ou le virus de l 1 herpes. 

A cet egard, la presente invention a egalement 
pour objet tout virus recombinant comprenant, insere dans 
son genome, un acide nucieique codant pour un fragment 
ScFv de I'anticorps 1C2 . Pref erent iellement , les virus 
utilises dans le cadre de 1' invention sent defectifs, 
e'est-a-dire qu'ils sont incapables de se repliquer de 
fagon autonome dans la cellule infectee. Generalement , 
le genome des virus defectifs utilises dans le cadre de 
la presente invention est done depourvu au moins des 
sequences necessaires a la replication dudit virus dans 
la cellule infectee. Ces regions peuvent etre soit 
eliminees (en tout ou en partie) , soit rendues non- 
f onctionnelles, soit substitutes par d'autres sequences 
et notamment par la sequence codant pour un fragment ScFv 
de I'anticorps 1C2. Pref erentiellement , le virus defectif 
conserve neanmoins les sequences de son genome qui sont 
necessaires a 1 1 encapsidation des particules virales. 

S'agissant plus particulierement d 1 adenovirus , 
differents serotypes, dont la structure et les proprietes 
varient quelque peu, on ete caracterises . Parmi ces 
serotypes, on prefere utiliser dans le cadre de la 
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presente invention les adenovirus humains de type 2 ou 5 
(Ad 2. ou Ad 5) ou les adenovirus d'origine animale (voir 
demande WO 94/26914). Parmi les adenovirus d'origine 

animale utilisables dans le cadre de la presente 

5 invention on peut citer les adenovirus d'origine canine, 
bovine, murine, (exemple : Mavl, Beard et al., Virology 
75 (1990) 81), ovine, porcine, aviaire ou encore simienne 
(exemple SAV) . De preference, l'adenovirus d'origine 
animale est un adenovirus canin, plus pref erentiellement 

0 un adenovirus CAV2 [(souche manhattan ou A26/61 (ATCC VR- 
800) par exemple]. De preference, on utilise dans le 
cadre de 1' invention des adenovirus d'origine humaine ou 
•canine ou mixte. 

Preferentiellement, les adenovirus defectifs de 
5 1' invention comprennent les ITR, une sequence permettant 
1 'encapsidation et la sequence codant pour un fragment 
ScFv de l'anticorps 1C2. Encore plus preferentiellement, 
dans le genome des adenovirus de 1* invention, la region 
El au moins est non f onctionnelle . Le gene viral 
0 considere peut etre rendu non fonctionnel par toute 
technique connue de l'homme du metier, et notamment par 
suppression totale, substitution, deletion partielle, ou 
addition d'une ou plusieurs bases dans le ou les genes 
consideres. De telles modifications peuvent etre obtenues 
in vitro (sur de l'ADN isole) ou in situ , par exemple, 
aux moyens des techniques du genie genetique, ou encore 
par traitement au moyen d' agent mutagenes . D'autres 
regions peuvent egalement etre modifiees, et notamment la 
region E3 (WO 95/02697)., E2 (WO 94/28938), E4 (WO 
94/28152, WO 94/12649, WO 95/02697) et L5 (WO 95/02697). 
Selon un mode pref ere de raise en oeuvre, l'adenovirus 
selon 1' invention comprend une deletion dans les regions 
El et E4. Dans les virus de 1' invention, la deletion dans 
la region El s'etend preferentiellement des nucleotides 
455 a 3329 sur la sequence de l'adenovirus Ad5 . 
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Les adenovirus recombinants defectifs selon 
1' invention peuvent etre prepares par toute technique 
connue de l'homme du metier (Levrero et al . , Gene 101 
(1991) 195, EP 185 573; Graham, EMBO J. 3 (1984) 2917) . 
En particulier, ils peuvent etre prepares par 
recombinaison homologue entre un adenovirus et un 
plasmide portant entre autre la sequence d'ADN codant 
pour un fragment ScFv de 1'anticorps 1C2. La 
recombinaison homologue se produit apres co-trans fection 
desdits adenovirus et plasmide dans une lignee cellulaire 
appropriee. La lignee cellulaire utilisee doit de 
preference (i) etre transformable par lesdits elements, 
et.(ii), comporter les sequences capables de complementer 
la partie du genome de l 1 adenovirus defectif, de 
preference sous forme integree pour eviter les risques 
de recombinaison. A titre d'exemple de lignee, on peut 
mentionner la lignee de rein embryonnaire humain 293 
(Graham et al., J. Gen. Virol. 36 (1977) 59) qui contient 
notamment, integree dans son genome, la partie gauche du 
genome d'un adenovirus Ad5 (12%). Des strategies de 
construction de vecteurs derives des adenovirus ont 
egalement ete decrites dans les demandes n°FR 93 05954 et 
FR 93 08596. 

Ensuite, les adenovirus qui se sont multiplies 
sont recuperes et purifies selon les techniques 
classiques de biologie moleculaire, comme illustre dans 
les exemples. 

Concernant les virus adeno-associes (AAV), il 
s'agit de virus a ADN de taille relativement reduite, qui 
s ' integrent dans le genome des cellules qu'ils infectent, 
de maniere stable et si te-speci f ique . lis sont capables 
d'infecter un large spectre de cellules, sans induire 
d'effet sur la croissance, la morphologie ou la 
dif f erenciation cellulaires. Par ailleurs, ils ne 
semblent pas impliques dans des pathologies chez l'homme. 
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Le genome des AAV a ete clone, sequence ez caracterise. 
II comprend environ 4700 bases, et contient a chaque 
extremite une region repecee inversee (ITR) de 145 bases 
environ, servant d'origine de replication pour le virus* 
Le reste du genome esc divise en 2 regions essentielles 
portant les fonctions d 1 encapsidation : la partie gauche 
du genome, qui contient le gene rep impiique dans la 
replication virale et 1' expression des genes viraux, la 
partie droite du genome, qui contient le gene cap codant 
pour les proteines de capside du virus. 

L 1 utilisation de vecteurs derives des AAV pour 
le transfert de genes in vitro et in vivo a ete decrite 
dans la litterature (voir notamment WO 91/18088; WO 
93/09239 ; US 4, 797, 368. USS. 139.941 EP 488 528). Ces 
demandes decrivent differentes constructions derivees des 
AAV, dans lesquelles les genes rep et/ou cap sont deletes 
et remplaces par un gene d'interet, et leur utilisation 
pour transferer in vitro (sur cellules en culture) ou in 
vivo (directement dans un organisme) iedit gene 
d'interet. Les AAV recombinants defectifs selon 
1' invention peuvent etre prepares par co-transf ection 
dans une lignee cellulaire infectee par un virus 
auxiiiaire humain (par exemple un adenovirus), d f un 
plasmide contenant la sequence codant pour un fragment 
ScFv de I'anticorps 1C2 borde de deux regions repetees 
inversees (ITR) d'AAV. et d'un plasmide portan les genes 
d' encapsidation (genes rep et cap) d'AAV. Les AAV 
recombinants produits sont ensuite purifies par des 
techniques classiques . 

Concernant les virus de l'herpes et les 
retrovirus, la construction de vecteurs recombinants a 
ete largement decrite dans la litterature voir notamment 
Breakfield et al., New Biologist 3 (1991) 203 : EP 
453242, EP178220, Bernstein e- al . Genet. Eng. 
7 (1985) 235:Mc Cormick, BioTechnology 3(1985)689, etc. 
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En particulier, les retrovirus sort des virus 
integratifs, infectant select ivement les cellules en 
division. lis constituent done des vecteurs d'interet 
pour des applications cancer. Le genome des retrovirus 
comprend essentiellement deux LTR, une sequence 
d 1 encapsidation et trois regions codantes (gag. pol et 
env) . Dans les vecteurs recombinants derives des 
retrovirus, les genes gag, pol et env sont generalement 
deletes, en tout ou en partie, et remplaces par une 
sequence d' acide nucleique heterologue d'interet. Ces 
vecteurs peuvent etre realises a partir de differents 
types de retrovirus tels que notamment le MoMuLV ("murine 
moloney leukemia virus 1 ' : encore designe MoMLV) . le MSV 

("murine moloney sarcomavirus" ) , le KaSV ("harvey sarcoma 
virus"), le SNV ("spleen necrosis virus") ; le RSV ("rous 
sarcoma virus") ou encore le virus de Friend. 

Pour construire des retrovirus recombinants 
selon 1 1 invention comportant un acide nucleique selon 
1 1 invention, un plasmide comportant notamment les LTR, la 
sequence d ' encapsidation et ledit acide nucleique est 
construit, puis utilise pour transfecter une lignee 
ceilulaire dite d 1 encapsidation, capable d'apporter en 
trans les fonctions retrovirales deficientes dans le 
plasmide. Generalement, les lignees d 1 encapsidation sont 
done capables d'exprimer les genes gag. pel et env. De 
telles lignees d 1 encapsidation ont ete decrites dans 
1 1 art anterieur, et notamment la lignee PA317 

(US 4,861, 719) , la lignee PsiCRIP (WO90/02S06) et la 
lignee G?+envAm-12 (WO89/07150) . Par ailleurs, les 
retrovirus recombinants peuvent comporter des 
modifications au niveau des LTR pour supprimer l'activite 
transcriptionnelle, ainsi que des sequences 

d f encapsidation etendues, comportant une partie du gene 
gag (Bender et al., J. Virol 61 (1987) 1639). Les 
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retrovirus recombinants produits sent ensuite purifies 
par das techniques classiques. 

Pour la mise en oeuvre de i a oresente 
invention, ii e3t tout particulierement avantageux 
d'utiliser ur. adenovirus ou un retrovirus recombinant 
defectif. ces vecteurs possedent en effet des proprietes 
particulierement interessantes pour l e transfert de 
-genes. L'adenovirus est particulierement prefere pour le 
transfert de genes dans le systeme nerveux (WO94/08026) . 

Avantageusement, dans les vecteurs de 
1' invention, la sequence codant pour un fragment ScFv de 
I'anticorps 1C2 est placee sous le controle de signaux 
permettant son expression dans les cellules nerveuses 
Preferentiellement, 11 s'agit de signaux depression 
heterologues, e'est-a-dire de signaux differents de ceux 
naturellement responsables de 1 'expression de 
I'anticorps. II peut s'agir en particulier de sequences 
responsables de 1' expression d'autres proteines, ou de 
sequences synthetiques . 

Notamment, il peut s'agir de sequences 
promotrices de genes eucaryotes ou viraux. Par exemple, 
xl peut s'agir de sequences promotrices issues du genome 
de la cellule que 1 ' on desire infecter. De meme, il peut 
s'agir de sequences promotrices issues du genome d • un 
virus, y compris du virus utilise. A cet egard, on peut 
citer par exemple les promoteurs E1A, MLP, CMV, LTR-RSV. 
etc. En outre, ces sequences d' expression peuvent etre 
modifiees par addition de sequences d • activation, de 
regulation, ou permettant une expression tissu- 
specif ique . 

La presente invention concerne egalement toute 
composition pharmaceutique comprenant soit I'anticorps 
1C2, un fragment ou derive de cet anticorps soit un ou 
Plusieurs vecteurs tels que decrits precedemment . Ces 
compositions pharmaceutiques peuvent etre formulees en 



WO 97/17445 



13 



PCT/FR96/01773 



vue d 1 administrations par voie topique, orale, 
parenterale, in tr anas ale, intraveineuse, intramusculaire/ 
sous-cutanee, intraoculaire, transdermique, intracerebral 
stereotaxique, etc. De preference, les compositions 
pharmaceutiques de 1' invention contiennent un vehicule 
pharmaceutiquement acceptable pour une formulation 
injectable, notamment pour une infection directe dans le 
cerveau du patient. II peut s'agir en particulier de 
solutions steriles, isotoniques, ou de compositions 
secheS/ notamment lyophilisees, qui, par addition selon 
le cas d'eau sterilisee ou de serum physiologique, 
permetten" la constitution de solutes injectables. 
L ' injection directe dans le cerveau du patent est 
avantageuse car elle permet de concentrer l'effet 
therapeutique au niveau des tissus af f ectes . 

Les compositions selon 1' invention sont tout 
particulierement utiles pour le traitement des maladies 
neurodegeneratives associees a la presence d ' une proteine 
portant une chaine homopolymere de glutamine. 

Les doses de virus recombinant defectif 
utilisees pour I 1 injection peuvent etre adaptees en 
fonction de differents parametres, et notamment en 
fonction du vecteur viral, du mode d 1 administration 
utilise, de la pathologie concernee ou encore de la duree 
du traitement recherchee. D'une maniere generale, les 
adenovirus recombinants selon 1 T invention sont formules 
et administres sous forme de doses comprises entre 10 4 et 
10 14 pfu/mi, et de preference 10 6 a 10 1C pfu/mi. Le terme 
pfu ("plaque forming unit*) correspond au pouvoir 
infectieux d'une solution de virus, et est determine par 
infection d'une culture cellulaire appropriee, et mesure, 
generalement apres 48 heures, du nombre de plages de 
cellules infectees. Les techniques de determination du 
titre pfu d'une solution virale sont bien documentees 
dans la litterature. Concernant les retrovirus/ les 
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compositions selon 1 • invention peuvent comporter 
direct^ment les cellules productrices, en vue de leur 
implantation . 

Sur le plan therapeutique il serait egalement 
necessaire de disposer d'un. outil de diagnostic fiable. 
Un tel outil serait en outre particulierement avantageux 
pour le diagnostic des predispositions familiales a 
deveiopper ce type de maladies. 

La presente invention a done d' autre part pour 
objet de proposer une methode de diagnostic de la maladie 
Huntington fondee sur un test biologique. 

La demanderesse s'est egalement ir.teressee a 
d'au-cres applications possibles de l'anticorps 1C2 dans 
le cadre de 1 ' identification d' agents respcnsables de 
maladies neurodegeneratives. Bien que les symptomes 
cliniques manifestos soient souvent tres differents la 
demanderesse a observe que certaines maladies 
neurodegeneratives presenter* en revanche de nombreux 
points communs, quant a leur mode de developpement, avec 
la maladie de Huntington. Ces ressemblances sent surtout 
une apparition des symptomes de plus en plus precoces et 
severes au cours des generations, notamment mais pas 
exclusivement par transmission d'un allele pacernei mute. 
Les agents pa thologiques responsables de ces maladies ne 
sont pas connus et sont souvent dif f icilement 
identifiables . II est particulierement interessant de 
rechercher s'il existe dans ces maladies un agent 
pathogene ressemblant dans sa structure a la proteine 
responsable de la maladie de Huntington. II est alors 
tres avantageux d'utiliser l'anticorps monoclonal 1C2 
pour detecter chez des sujets atteints de ces maladies la 
presence de chaines polyglutamine . Ceci rend possible 
1' identification des proteines portant ces chaines qui 
sont susceptibles d'etre les agents pathalogiques 
recherches . 
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1C2 reconnait ainsi les ataxines-1 a 55 
glutamines ou plus, dans le cas des SCA 1 (ataxie 
spinocerebelleuse 1), et trois proteines (une proteine 
majeure a 68K et cieux proteines mineuses a 74K et 87K) , 
dans le cas des SCA3 (Maladie de Machado- Joseph) . 

L'anticorps 1C2 permet, en outre, 

avantageusement de differencier une SCA2 (ataxie 
spinocerebelleuse de type 2) d'une ADCA II (ataxie 
cerebelleuse autosomale dominante de type II) en 
distinguant les proteines impliquees dans les phenotypes 
respectifs (proteine de 130K environ pour ADCA II, 
proteine de 150K environ, pour SCA2, poids moleculaires 
estimes par migration electrophoretique ) . 

1C2 peut ainsi avantageusement permettre 
d' identifier les formes pathogenes des proteines 
impliquees dans toute maladie neurodegenerative a 
anticipation prouvee ou suggeree, telle que les ADCA de 
type I (SCA4, SCA5 par exemple), AD-FSP (paraplegie 
spastique familiaie) ou bien encore dans certaines form.es 
et dans certains cas de maladies affectives bipolaires 
(psychoses maniaco-depressives ) ou de schizophrenic . 

L 1 identification des proteines responsables de 
ces maladies permet d'acceder a 1'etape de sequengage. 
L 1 invention fournit alors les mo yens de construire des 
sondes d ! ADN appropriees, pour 1 1 ident i f icat ion du gene 
responsable et la mise en oeuvre de traitements de 
therapie genique tels que decrit ci-dessus. 

Apres avoir caracterise l'anticorps 1C2 et 
montre qu'il detecte de maniere specif ique sur transferts 
Western les proteines pathologiques presentes chez les 
patients atteints de HD, de SCA1 et ce SCA5, la 
demanderesse a egalement demontre que des proteines 
anormales etaient presentes dans des patients de families 
SCA2 ou SCA7. 
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Ceci est en tres bonne correlation avec les 
observations cliniques d 1 anticipation chez ces families. 
La proteine SCA2 mutante est cytoplasmique avec une masse 
moleculaire apparente de 150 kDa environ aiors que la 
proteine SCA7 est nucleaire avec une masse moleculaire 
d ! environ 130 kDa. 

La demanderesse a alors utilise les proprietes 
surprenantes et avantageuses de I'anticorps 1C2 pour 
isoler, par criblage d f expression, des genes impliques 
dans des maladies a extensions polyglutaminiques . 

En plus de trois genes connus, 1C2 a ainsi 
permis, par criblage de banqu.es d f expression ADNc, de 
doner puis de sequencer 6 nouveaux genes contenant des 
repetitions CAG et pouvant etre impliques dans des 
maladies a chaines polyglutaminiques (motifs codants les 
chaines polyglutaminiques de ces genes en SEQ ID n°l a 6 
et ADNc de SCA2 en entier en SEQ ID n°7) . 

Ces six nouveaux genes ne presentent que de 
tres faibles homologies avec les genes connus. 

Un de ces nouveaux genes (SEQ ID n°7 et 3) 
porte une mutation chez les patients atteints d'ataxie 
spinocerebelleuse de type 2 ( SCA2 ) , c'est-a-dire liee au 
chromosome 12q. Ce gene presente une expression 
ubiquitaire . 

L T invention, objet de la presente demande, a 
done egalement pour objet six nouveaux genes susceptibles 
d'etre impliques dans des maladies neurodegeneratives ou 
psychiatriques a chaines polyglutaminiques, et, en 
particulier le gene implique dans l'ataxie 
spinocerebelleuse de type 2 (gene SCA2) . 

Les alleles impliques dans SCA2 ont, dans leur 
forme normale, de 17 a 29 triplets CAG repetes entre 
lesquels s 1 intercalent de 1 a 3 triplet (s) CAA. 

Dans leur forme mutee, les alleles impliques 
dans SCA2 presentent chez les patients etudies de 37 a SO 
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triplets CAG repetes, ce nombre n'etant pas limitatif et 
etant en tout etat de cause superieur a 30 triplets. lis 
apparaissent comrne particulierement instables lors des 
transmissions a la fois paternelles et maternelles. La 
sequence de trois d'entre eux presente des chaines 
purement CAG. 

Le fait qu'une correlation inverse 
particulierement abrupte soit observee entre 1 1 age ou se 
declare la maladie et le nombre de repetitions CAG 
suggere une plus grande sensibilite a la longueur des 
chaines polyglutaminiques pour SCA2 que pour les autres 
maladies liees a une extension polyglutaminique . 

Les experiences precedentes en transferts 
Western suggeraient que le seuil inferieur de detection 
en utilisant I'anticorps 1C2 etait d' environ 30 
glutamines . 

De maniere surprenante et inattendue, 1C2 a 
permis de doner des ADNc codant pour des chaines de 
seulement 12 a 26 glutamines. 

Cela pourrait etre du a une plus forte 
sensibilite du cionage d 1 expression (plus forte abondance 
locale de proteines cibles et plus faible complexity des 
autres proteines), et/ou a une difference dans les 
conditions pour la reaction antigene/ant icorps (pas de 
denaturation par le SDS dans le criblage des colonies). 

En consequence 1 1 utilisation de l'anticorps 
monoclonal 1C2 se generalise au diagnostic precoce de 
sujets susceptibles de developper toute maladie 
neurodegenerative liee a I 1 expression d'une proteine 
ayant dans sa structure une longue chaine poiyglutamine , 
ainsi que des families a risques qui expriment des 
proteines dont la chaine poiyglutamine comprend un nombre 
de residus a la limite du pathologique . Ce diagnostic 
peut utiliser directement I'anticorps 1C2 ou se faire par 
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analyse de l'ADN au niveau de genes codant pour des 
polyglutamines, genes identifies grace a l'anticorps 1C2 . 

Pour proceder a ces differents diagnostics, on 
utilise un anticorps monoclonal 1C2. Cet anticorps est 
mis en contact avec un extrait cellulaire obtenu a partir 
de cellules du patient exprimant la proteine recherchee. 
L'anticorps interagit avec cette proteine au niveau de 
1* epitope represents par la longue chaine polyglutamine . 
Les complexes Anticorps-Antigenes sont ensuites reveles 
par tout moyen connu de l'homme du metier (marquage de 
l'anticorps, utilisation d'un deuxieme anticorps 
fluorescent anti-lC2, ELISA, etc.). L'intensite de 
1/ interaction est determinee. C'est en foncticn de cette 
derniere que 1 * on peut etablir le diagnostic. 

1.C2 peut egalement etre utilise pour la 
localisation subcellulaire des formes pathologiques des 
proteines impliquees dans la maladie, pour suivre leur 
accumulation ou 1 * accumulation de leurs produits 
degradation. 

La methode objet de la presente invention ouvre 
la voie a de nouvelles methodes de trai-ement des 
maladies neurodegeneratives basees sur une meilleure 
connaissance des proteines pathologiques qui en sont 
responsables . 

L' invention objet de la presente demande, porte 
non seulement sur 1 ' utilisation des proprietes nouvelles 
de l'anticorps 1C2 et sur les proteines impliquees dans 
la pathogenicity des maladies neurodegeneratives a 
chaines polyglutaminiques, mais aussi sur de nouveaux 
genes egalement impliques dans ces maladies. 

Les six nouveaux genes pouvant etre impliques 
dans des maladies neurodegeneratives a chaines 
polyglutaminiques selon 1' invention, gene SCA2 inclus, 
sont d'une importance cruciale pour la comprehension des 
mecanismes de pathogenicity de ces maladies. 
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lis permettent la mise au point directe de 
sondes. d 1 acides nucleiques, eventuellement marquees de 
maniere a permettre la detection des formes normales ou 
mutees de ces genes, capables de s'hybrider avec les 
acides nucleiques (ADN ou ARN} impliques dans ces 
maladies neurodegeneratives a chaines poiyglutaminiques . 

De telles sondes nucleiques sont 

particulierement utiles pour ie suivi des families a 
risques, le conseil genetique prenatal et la 
discrimination entre les differences maladies 
neurodegeneratives, certaines d' entre elles pouvant 
presenter des symptomes proches . 

La presente demande a done egalement pour objet 
de relies sondes nucleiques, portant eventuellement une 
substitution chimique, sous forme libre ou associee, des 
compositions pharmaceutiques les renfermant dans un 
tampon approprie, une methode in vitro de diagnostic 
et/ou de conseil genetique mettant en oeuvre lesdites 
sondes a I'aide d'une technologie telle que PCR, RT-PCR, 
et des kits de diagnostic comprenant lesdites sondes. 

De telles sondes, selon 1' invention, peuvent 
egalement servir de vecteurs de substances 
medicamenteuses pour delivrer lesdites substances 
medic amen reuses au niveau des zones presenran: lesdits 
genes, sous leur forme normale ou pathologique . 

Les nouveaux genes selon 1 T invention permettent 
egalement la mise au point directe d 1 acides nucleiques 
anti-sens (ADN ou ARN) utiles comme medicaments, dans le 
rraitement de maladies neurodegeneratives. 

La presente demande vise done egalement de tels 
acides nucleiques anti-sens, portant eventuellement, le 
cas echeant, une substitution chimique, sous forme libre 
ou associee, eventuellement inclus, encapsule ou adsorbe, 
des compositions pharmaceutiques les renfermant dans un 



WO 97/17445 



20 



PCT/FR96/01773 



tampon approprie, et des kits a usage therapeutique 
comprenant lesdits acides nucleiques anti-sens. 

La presente demande porte non seulement sur 
lesdits nouveaux genes, sondes nucleiques, acides anti- 
sens seion 1' invention mais aussi sur tout acide 
nucleique presentant une homologie superieure ou egale a 
50% avec ces produits, sur tout fragment de ces produits, 
et sur toute banque d« acides nucleiques obtenues par 
criblage d' expression a l'aide de l'anticorps 1C2 de 
iignees cellulaires, issues de patients ou d'animaux 
atteints d'une maladie neurodegenerative. 

La presente demande vise egalement un procede 
d' identification ou de purification de proteines a 
chaines polyglutaminiques utilisant une etape 
d' immunodetection ou d • immunopurif ication par l'anticorps 
1C2, fragment ou derive de cet anticorps, ou pouvant 
conduire secondairement a identifier le gene 
correspondant . 

La presente demande vise enfin une methode de 
diagnostic utilisant 1 ■ amplification PCR sur ADN ou RT- 
PCR sur ARN permettant de detecter des formes mutees dans 
des genes codant pour des chaines polyglutaminiques 
identifiees ou donees grace a l'anticorps 1C2. 

La presente invention sera decrite plus en 
detail a l'aide des exemples qui vont suivre et qui 
doivent etre consideres comme illustratifs et non 
limitatif s . 

Dans ces exemples, il est fait reference aux 
figures 1 a 8: 

la figure 1 represente ie criblage 
d' expression d'une banque d ' ADNc en utilisant 

l'anticorps 1C2, 

- la figure 2 represente la detection par PCR 
d' alleles etendus dans une famille SCA2, 
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la figure 3 represente les structures 
cT alleles normaux et pathologiques / 

- la figure- 4 represente la distribution des 
tailles alleliques au locus SCA2, 

5 - la figure 5 represente 1 1 ins tabilite de la 

repetition SCA2 au cours de transmissions de parents a 
enf ants, 

- la figure 6 represente la correlation entre 
l'age de declenchement de la maladie clinique et le 

10 nombre de repetitions, 

- la figure 7 represente la sequence de l'ADNc 

SCA2, et 

la figure 8 represente l 1 analyse par 
transfert Northern de l f expression du gene SCA2. 

15 

EXEMPUES: 

Techniques qenerales de biologie moleculaire 

Les methodes classiquement utilisees en 
20 biologie moleculaire telle que la technique de Western 
Blot, le marquage d'anticorps, etc... sont bien connues 
de 1 T homme de metier et sont abondamment decrites dans la 
licterature (Maniatis T. et al., "Molecular Cloning, a 
Laboratory Manual", Cold Spring Harbor Laboratory, Cold 
25 Spring Harbor, N.Y., 1982; Ausubel F.M. . et al, (eds), 
"Current Protocols in Molecular Biology", John Wiley & 
Sons, New York, 1987) . 

Exemple 1: Mise en evidence de I'af finite 

30 specif ique de l'anticorps monoclonal 1C2 pour les 

chaines polyglutamines . 

Afin de mettre en evidence sa capacite a 
reconnaitre des proteines possedant une chaine 
homopolymere de glutamine, mAclC2 a tout d'abord analyse 
35 en "Western Blot" sur des extraits de lignees cellulaires 
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lymphoblastoides (ci-apres LCD provenant a * individus 
normaux et d' individus atteints de la maladie de 
Huntington presentant des longueurs variees de chaines 
polyglutamines dans les HDP (Huntington Disease Protein) . 

Ces differentes proteines sont tout d'abord 
mises au contact d'un anticorps monoclonal anti-HDP. On 
•observe lors de 1 'analyse en Western Blot que 1'on 
discriniine tres facilement les proteines norma les de 
celles ayant une chaine polyglutamine allongee, grace a 
leur difference de poids molecuiaire. Par contre, lorsque 
le meme lot est analyse avec 1' anticorps monoclonal 1C2, 
seules les proteines HDP a longue chaine polyglutamine 
sont- detectees, les proteines normales ne donnant pas de 
reponse. La reponse obtenue avec mAclC2 est specif ique 
des proteines pathologiques . 

II est egalement tres interessant de constater 
que l'intensite du signal depend de la longueur de la 
chaine poluglutamine . Cette intensite est tres forte pour 
les chaines de plus de 50 unites et minimale pour des 
chaines de 39-40 unites. 

Exemple 2: Mis e en evidence d'une correlation 

entre la longueur de la chaine polyglutamine et 

1 ' augmentation de l'af finite de 1C2 pour celle-ci 

Cette relation entre intensite du signal et 
longueur de chaine a ensuite ete examinee a 1 ' aide 
d'echantillons ordonnes en ordre de longueurs de chaines 
decroissantes en partant du plus grand allele. On observe 
que la valeur de l'af finite de 1' anticorps monoclonal 1C2 
pour les formes mutantes de HDP depend clairement de la 
longueur de la chaine de polyglutamine. En effet, 
l'intensite du signal est plus forte pour les proteines 
ayant une chaine de 60 a 85 residus que pour les 
proteines ayant une chaine de 39 ou 40 residus, cette 
derniere etant elle-meme plus forte que celle observee 
pour des chaines plus courtes. 
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On observe egalement qu'une duree d 1 exposition 
a l'anticorps prolongee permet la detection des proteines 
ayant une chaine dont la longueur se situe a la limite 
superieure des proteines normales ( > 28) . 

Une comparaison semi-quantitative de 

I'intensite du signal detecte avec des HDP comprenant 36, 
60 et 85 residus glutamine a ete effectuee a partir d'une 
serie de dilutions d'extraits de LCL. L'intensite du 
signal HDP observee est 2 a 4 fois plus importante avec 
des chaines de 85 residus qu'avec des chaines de 60 
residus et de 10 a 20 fois plus importante avec des 
chaines de 60 residus qu'avec des chaines de 39 residus. 

Exemple 3: Mise evidence que 1' epitope reconnu 
par mAclC2 est uniquement la chaine polyglutamine 

Lorsqu'on procede au sequencgage de la proteine 
HDP on remarque que le peptide LEEQQRQQQQQQ de TBP qui 
est reconnu par l'anticorps n'est pas present dans les 
sequences qui entourent la chaine de residus glutamine 
dans HDP . On en deduit que 1 f epitope de HDP qui est 
reconnu par l'anticorps monoclonal 1C2 est bien 
uniquement la chaine polyglutamine et que I'intensite du 
signal est uniquement dependante de la longueur de celle- 
ci . 

Une experience de verification a ete faite avec 
differents alleles de TBP qui possedent egalement des 
chaines polyglutamine dont la longueur varie de 29 a 42 
residus. L ' analyse en Western Blot, apres exposition a 
1C2, a permis de discriminer les alleles en fonctipn de 
leur taille. La aussi I'intensite du signal est plus 
importante avec les chaines de grandes taiiles et les 
chaines comprenant entre 27 et 30 residus ne sont pas 
detectees . 

L'anticorps 1C2 est done capable de reconnaltre 
specif iquement une sequence polyglutamine. L'intensite du 
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signal obtenu depend de la longueur de ladite sequence 
plus c-elle-ci est longue plus I'intensite est forte. 

Exemple 4: Detection d'une epitope patholoqique 
5 dans les ataxies spinocerebelleules SCA1 et SCA3 . 

Pour mettre en evidence la capacite de mAclC2 a 
detecter select ivement d'autres proteines pathogenes 
comprenant une longue chaine polyglutamine, nous avons 
analyse en Western Blot des extraits de LCL provenant de 
10 patients atteints de SCA1 et SCA3. 

Lors de l 1 experience de liaison avec mAclC2 / 
une proteine de 100 kD a ete specif iquemenc detectee dans 
les extraits provenant de patients atteints de SCA1 alors 
qu'elle etait absente des extraits provenant de patients 

15 atteints de SCA3 . Cette proteine correspond a l'ataxine 
1, la proteine responsable de SCAi . Inversement , dans les 
extraits de LCL provenant de patients atteints de SCA3 on 
a detecte au moins 4 proteines (une bande majeure 
correspondant a une proteine de 68 kD et trois bandes 

20 mineures correspondant a des proteines de 64, 74 et 87 
kD) qui sont absentes des extraits provenant de patients 
atteints de SCAI. Un controle effectue sur 9 LCL 
provenant de sujets sais ne montre aucune de ces bandes. 
Dans tous les cas, aussi bien chez les sujets sains que 

25 chez les sujets atteints, on retrouve une bande 
correspondant a la TBP et une autre correspondant a une 
proteine d' environ 230 kD. On peut en conclure que mAclC2 
est specif iquement des proteines responsabies de SCAI et 
SCA3 et peut done etre utilise dans le diagnostic de ces 

30 deux maladies. 



Exemple 5: Mise en evidence de la presence de 
proteine contenant une longue chaine polyglutamine dans 
d'autres maladies neurodegeneratives grace a mAclC2. 
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Les caracteris tiques phenotypiques communes a 
toutes les maladies considerees se retrouvenr dans 
d'autres maladies neurodegeneratives comme l'ataxie 
cerebeileuse autosomale dominante (ADCA) et la paraplegie 
spasmodique familiale (FSP) pour lesquelles la/les 
proteine (s) responsables ainsi que ie(s) gene(s) 
correspondant n'ont pas encore ete mis en evidence. 

On a teste en aveugle des extraits de LCL 
provenant de sujets atteints de ces deux maladies, et de 
SCA1, SCA3 et la maladie de Huntington. 

Sur les 9 LCL testees, 4 montrent une bande 
correspondant a une proteine specifique de 130 kD ou de 
150 kD, 3 ne montrent aucun signal specifique ez les deux 
autres presentent des bandes correspondant aux proteines 
mutees responsables de SCA1 et appartiennent aux temoins. 

Les resultats obtenus ont ete compares aux 
donnees des dossiers medicaux des sujets de 1 1 experience . 
Les coionnes portant la bande pour une proteine de 130 kD 
correspondent a des echantillons provenant de patients 
atteints d ' ADCA de type II entrainant une degeneration 
retinienne. Des experiences de cartographie chromosomique 
ont permis de localiser le gene correspondant a cette 
proteine de 130 kD sur le chromosome 3p, ce locus 
correspond au locus presume responsable de la maladie. On 
a egaiement retrouve cette meme proteine dans d'autres 
patients atteints d 1 ADCA de type II appartenant a- 
d 1 autres families . 

La proteine de 150 kD a ete recherchee chez 
d'autres patients atteints d ' ADCA portant une mutation 
dans le gene SCA2 ainsi que chez des personnes de la meme 
famille n'ayant pas developpe la maladie. La proteine est 
toujours presente mais chez les sujets sains la longueur 
de la chaine polyglutamine est plus petite et done non 
detectee dans les conditions experimentaies telles que 
decrites ci-dessus. 
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On peut done en deduire que cette proteine de 
150 kD est bien responsable d'une maladie 
neurodegenerative associee a 1 • allongement d'une chaine 
polyglutamine dans une proteine normale qui presente ies 
memes caracteristiques de transmission que la maladie de 
Huntington. 

Exemple 6: localisation intracellulaire des 

proteines patholoqiques . 

L'anticorps mAclC2 a egalement ete utilise pour 
determiner la localisation intracellulaire ce la proteine 
responsable de SCA3 ainsi que celle des proteines 
nouvellement identifies et qui sont liees a 1 ' ADCA de 
type II et a SCA2 . 

L'analyse des fractions celiulaires est 
effectuee selon la technique du Western Blot. On utilise 
des fractions enrichies provenant des differents 
compartiments celiulaires : le compartiment cycoplasmique 
et le compartiment nucleoplasmique. L * hybridation est 
realisee avec mAclC2 marque. 

Les ataxines 2 et 3 ainsi que la KDP mutante 
ont ete localisees dans la fraction cytopiasmique . La 
proteine de 130 IcD liee a l'ADCA de type II a quant a 
elle ete localisee dans la fraction nucleoplasmique. Des 
tests de controls effectue avec la TBP dont la 
localisation cellulaire est connue ont Dermis de valider 
ces resultats. 



Exemple 7 : clonage du gene impiique dans 
l'ataxie cerebelleuse de type 2 (SCA2). 

. Methode 

Banques d' express ion ADNc 

Des ARN poly A+ SCA2 et SCA7 ont ete prepares a 
partir de lignees celiulaires lymphoblastoidiques (LCD 
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de patients SCA2 et SCA7 . La 
reaiisee en utiiisant des ol 
aleatoires. Les ADNc ont ete 
EcoRI et clones dans des bras 
(Novagen®) et inseres en 
f abricant . 

Criblage des banques d' expression en utiiisant 
l'anticorps 1C2 . 

Les phages ont ete incubes pendant 15 minutes 
pour infection avec les bacteries BL21 dans LB contenant 
du maltose 0,2 mM, HgS0 4 10 rnM et du chloramphenicol a 
4 0.mg/mi. Environ S.IO 3 pfu de chaque banque ont ete 
deposees sur un milieu NZY. Lorsque les plaques furent 
visibles, une membrane en nylon imbibee de IPTG lOmM a 
ete placee sur les boites et 1' induction de I 1 expression 
a ete reaiisee pendant 3 heures 30 minutes. Les membranes 
ont ete ensuite lavees deux fois dans du PBS lx, Tween 
0,05% pendant 5 et 30 minutes respectivement . 

Les membranes, ont ete bloquees dans du lait 
ecreme a 5% puis incubees avec l'anticorps monoclonal 
1C2. L'anticorps secondaire ( immunoglobulines de chevre 
anti-souris) a ete couple a une peroxydase pour permettre 
une revelation avec le kit ECL (Amersham®) . Les temps 
d f exposition sont couramment de 20 minutes. 

Les plaques positives ont ete eiuees a 4°C dans 
un milieu SM et les phages ont ete transformes dans les 
bacteries BL21 comme ci-dessus decrit. Un criblage 
secondaire et, si necessaire, tertiaire a ete realise 
comme ci-dessus. Les phages positifs iscles ont ete 
excises en suivant le protocole du fabricanr (Novagen®) 
et les plasmides obtenus ont ete transformes dans des 
bacteries HB101. 

Analyses PGR et sequengage direct 



transcription inverse a ete 
igonucleo tides hexameriques 
ligatures a des adaptateurs 
de vecteur EcoRI I -SCREEN- 1 
suivant le protocole du 
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Des RT-PCR ont ete realisees en utilisant les 
amorces suivantes: 

DANl: CGTGCGAGCCGGTSTATGGG (UH13); GGCGACGCTAGAAGGCCGCT (UH10) 

DAN15: CCACCATGCCCACCACCTCC; CCGCGCCGCCCAAGCTGTTG: 

DAN25: AATGACGTGCTGCACCACTG; CCAGGCATCTGGATGGGAGG: 

AAD10: CCTCGGACCTGATTCAAGGC; GCTGCTGGGAGGGATAAGGC: 

AAD14: AAGTGCCCCTGTCCATCCTCT; GGAGAGGAGTGCAACAGACC' 

AAD20: CGGTCGCGGCAATCCTAG; GAGGTTCCGGCTCGGAC7. 



Les amorces realisees pour DANl , DNA15, AAD14 
et ADD20 permettent 1 • amplification de l'ADN genomique. 
15 Les Produits ont ete analyses sur un gel 

d' agarose a 2% et transferes sur une membrane de nylon 
pour hybridation avec une sonde oligonucleotidique 
(CAG)16. Pour 1 'analyse PCR des alleles SCA2 , 100 ng 
d'ADN genomique ont ete amplifies dans 20 ml de Tris-HCl 
lOmM (pH 8,3), KC1 50 mM, MgCl 2 1,5 mM, glycerol 15%, 250 
mM de chaque dNTP, et 10 pmoles d' amorces UH10 et UH13. 
Apres un demarrage a chaud de 5 minutes a 96°C, 0,5 U de 
Taq polymerase a ete ajoutee, 35 cycles (30 secondes a 
94°C, 30 secondes a 65°C, 30 secondes a 72°C) et une 
25 elongation finale de 10 minutes a 72°C ont ete realises. 
Les produits ont ete deposes sur un gel denaturant a 6% 
de polyacrylamide et 7 M d'uree. lis sont transferes et 
hybrides avec une sonde (CAG)7. Pour le sequencage direct 
des alleles SCA2, 40 cycles ont ete realises [les alleles 
"etendus" ont ete mieux amplifies en 1' absence de KC1 et 
de glycerol) et les fragments excises ont ete sequences 
sur un sequenceur automatique Applied Biosystems® (ABI ) 
avec des didesoxynucleotides f luorescents . 



35 



Analyses des transferts Northern et Zoo 
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Un fragment d'ADNc EcoRI de 2,5 kb 
correspondant a l'extremite 3 f du clone DAN1 a servi de 
sonde pour les analyses de transferts Northern et Zoo. 
Les transferts Northern de MTN humains et MTN II issus de 
5 cerveaux humains ont ete obtenus par Clontech®. 
L 1 hybridation des sondes a ete realisee en utilisant la 
solution d' hybridation ExpressHyb® (Clontech®) . Les 
transferts ont ete laves dans du SSC 0,lx, SDS 0,1% a 
55°C. L 1 hybridation des transferts Zoo a ete realisee 
1 0 dans du f ormamide a 30s. Le lavage a ete realise dans du 
SSC 0, 5 x, SDS 0, 1% a 51°C. 

. Resultats 

Clonage d* expression d'ADNc contenant des 
15 polyglutamines 

L 1 utilisation selon l f invention de l'anticorps 
monoclonal 1C2 avait permis precedemment de detecter dans 
des lignees lymphoblas tiques de patients presentant les 
formes SCA2 et SCA7 de ADCA (ataxie cerebelleuse 

20 aucosomale dominante) des proteines pathoiogiques devant 
contenir une longue chaine polyglutaminique . 

Pour essayerde doner les ADNc correspondants, 
deux banques d'ADNc lymphoblas tiques ont ete construites 
dans un vecteur d' expression de bacteriophages I (I- 

25 Screen-1, Novagen®) , en utilisant des lignees 
cellulaires de patients SCA2 (AAD) ou SCA7 (DAN) . Environ 
8.10" clones ont ete deposes sur plaques a partir de 
chaque banque et ont ete cribles avec l'anticorps 1C2 . 

21 clones positifs ont ete obtenus apres trois 

30 iterations de criblage. 

En figure 1, est represents le criblage 
d ? expression d'une banque d'ADNc en utilisant l'anticorps 
1C2 : la partie superieure gauche rectangulaire montre la 
detection du clone DAN1 a l'etape primaire de criblage 

35 (environ 20 000 pfu par boite) , avec un arriere-plan tres 
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clair. Les autres parties rectangulaires correspondent 
aux cribiages secondaires de ce clone (environ 100 pfu 
par boite) . 

Tous, excepte deux, contiennent des repetitions 
CAG teiles que determinees par hybridation avec une sonde 
oligonucleotidique (CAG) 10. 

Les 19 clones positifs a CAG correspondent a 8 
transcrits differents et sont presentes dans le tableau 
suivant . 
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Les 19 clones positifs incluenc un ADNc 
d'huntingtine normale (20 gin) et un ADNc pour le 
facteur de transcription hSNF-oc 3: , qui contient aussi une 
repetition polyglutaminique (26 gin) . La taille de la 
derniere proteine (174 kDa) l'exclut comme candidat pour 
les genes de SCA2 ou SCA7. 

Les six autres transcrits correspondent a des 
genes contenant CAG nouveaux. 

Aucun des clones ne presente cependant un 
nombre de repetitions pathologique attendu ( > 35 gin), 
les plus Iongues chaines consistant en 14 CAG 
ininterrompus (AAD14 et AAD20) . Dans tous les genes 
exceptes AAD2C, ie cadre de lecture ouvert permet de 
predire de maniere non ambigue une chaine 
polyglutaminique. En tenant compte des interruptions par 
les codons CAA, les plus Iongues chaines 
polyglutaminiques predites ont ete trouvees dans DAN1 (22 
gin) et DAN15 (18 gin).. Ce resultat est inattendu par 
rapport aux resultats obtenus au preaiable par transferts 
Western pour lesquels 1C2 ne detecte que les chaines 
d'une longueur superieure a 30 gin dans des extraits 
cellulaires entiers. 

Identification d'un clone SCA2 . 

Bien que - les repetitions obtenues 

n'apparaissent tres etendues, il restait possible qu ' un 
des clones represente un allele normal au locus SCA2 ou 
SCA7, ou bien la retractation d'un allele etendu du fait 
de 1 ' instability des Iongues repetitions dans les 
bacteries. 

Des amorces adjacentes aux repetitions (voir 
methode) ont done ete construites et testees par RT-PCR 
ou PCR sur, respectivement, de 1 ' ARNm ou de 1 ' ADN 
genomique obtenus de patients SCA2 et SCA7 . 
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Une paire d'amorces (derivees de DAN1) detecte 
les fragments RT-PCR etendus des patients SCA2 . Cela a 
ete confirme en utilisant les memes sondes dans toutes 
les families SCA2 testees au niveau de l'ADN genomique. 
5 En figure 2 est representee la detection par 

PCR d 1 alleles etendus dans une famille SCA2 : l 1 analyse 
PCR a ete realisee en utilisant les sondes UH10 et UH13; 
les tailles aileliques (nombre de repetitions) sont 
22/37, 23/38, 22/43, 22/43, 22/23 et 22/22 pour les 

10 individus 1 a 6 respectivement ; . le pere dans la 
generation II a transrnis des alleles etendus par 5 
repetitions a ces deux filles affectees; ceci est correle 
avec une forte anticipation (I 1 age de declenchement de la 
maladie est indique sur le pedigree); on note une 

15 heterogeneite apparente des alleles mutants; la plus 
forte bande a ete utilisee pour la determination des 
tailles de repetitions. 

De plus, ces amorces amplifient le fragment 
correspondant dans quatre YAC de la region candidate SCA2 

20 de 12q23-24.1 (CEPH YAC 674f2, 722h7, 774a3 et 910gl) qui 
contiennent egalement le microsatellite D12S1340 
(AFM291xe9) . 

Alleles normaux et pathologiques 

25 La repetition originelle dans le clone DAN1 est 

interrompue par deux triplets CAA. Afin de verifier si 
les interruptions sont trouvees dans les alleles normaux 
de maniere generale, les produits PCR correspondants a 17 
alleles normaux independancs ont ete sequences. 

30 Tous les alleles analyses contiennent de 1 a 3 

CAA disperses, dans les plus communs des cas (9 sur 17) 
deux CAA sont observes . avec une structure (CAG) 8 CAA 
(CAG) 4 CAA (CAG) 8, comme pour DAN1 . 

En figure 3, est representee la structure 

35 d' alleles normaux et pathologiques: le sequengage direct 
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des produits PCR montre des codons CAA intercalaires 
(cercles pleins) parmi des repetitions CAG (cercles 
vides); deux alleles pathologiques a 40 et 41 repetitions 
et un allele a 34 repetitions d'un porteur cliniquement 
normal d'un haplotype SCA2 ont ete amplifies dans 
differentes conditions et ne montrent pas de CAA 
intercalaires . 

Par analyse PCR de 110 alleles, un nombre 
normal de 17 a 29 repetitions a ete observe. 22 
repetitions ont ete observees pour 75% des alleles alors 
que le nombre lie a la pathogenici te etait de 37 a 50 
repetitions (n=31) . 

En figure 4, est representee la distribution 
des tailies alleliques au locus SCA2 : les analyses PCR 
d'individus francais normaux et SCA2 ont ete realisees 
comme decrit ci-dessus; les 110 alleles normaux sont des 
alleles independants alors que les 31 alleles 
pathologiques (barres pleines) derivent de 8 families. 

Deux alleles mutants independants ont ete 
sequences et se presentent comme constitues de pures 
chaines CAG (voir figure 3), tout comme s'est presente un 
allele a 34 CAG d'un individu age de 32 ans cliniquement 
normal issu d • une famille SCA2 . Cet individu est porteur 
de 1' haplotype pathologique . 

Instabilite et age de declencheraent de la 

maladie 

Dans les 16 cas de transmissions de parents a 
enfants que nous avons pu etudier, 13 ont mis en evidence 
une instabilite. Un seul cas a mis en evidence une 
diminution (de 3 unites), et de maniere plus frappante, 5 
cas ont mis en evidence une augmentation de 5 a 10 
repetitions. Voir, a ce sujet, la figure 2 et voir 
egalement la figure 5 qui represente 1 ' instabilite de la 
repetition SCA2 lors d'une transmission de parents a 
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enf ants : la difference entre le nombre d' unites de 
repetitions dans les alleles etendus de parents et 
enfants a ete determinee pour neuf transmissions 
paternelles et sept transmissions materneiles chez 8 
families . 

Ces grands sauts ont ete observes pour les 
transmissions a la fois paternelles et materneiles, 
contrairement a ce qui a ete observe dans les autres 
maladies iiees aux chaines polyglutaminiques . 

line forte correlation inverse entre 1 ' age de 
declenchement de la maladie et la longueur des 
repetitions a ete observee pour 26 patients (r = -0,86 
avec une regression quadratique, p = 0,0001). 

En figure 6, est representee la correlation 
entre 1 ' age de declenchement de la maladie ciinique et le 
nombre de repetition: les donnees proviennent de 26 
patients (age moyen de declenchement de la maladie = 34 
ans, gamme allant de 13 a 60 ans) ; le coefficient de 
correlation est calcule pour une regression quadratique 
(r = -0, 86; p < 0, 0001) . 

L'effet de repetitions addi tionnelles esc 
frappant: pour quatre patients presentant 37 repetitions, 
1 1 age de declenchement de la maladie s'est situe entre 45 
et 60 ans alors que pour les trois patients presentant de 
46 a 50 repetitions, 1 f age de declenchement de la maladie 
s'est situe entre 13 et 18 ans. 

Le gene SCA2 et son expression 

Le clone DAN1 (4,0kb) a ete ent lerement 
sequence: en figure 7, est representee la SEQ ID n°7. 

La figure 7 represente en effet la sequence de 
I'ADNc SCA2 . La sequence nucleotidique de la position 1 a 
3986 provient du clone DAN1 . Les dernieres 177 paires de 
bases (en italique) proviennent de EST (H92640, N90240 et 
Z13574 de dbEST) qui chevauchent, de maniere non ambigue, 
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l'extremite 3« de la sequence DAN1 . Seules les sequences 
communes aux trois EST or.t ete ici ajoutees a la sequence 
DAN1. La chaine polyA interne a la position 4002 differe 
en longueur des trois EST (indiques par un a en lettre 
minuscule) et n'est pas precedee par un signal de 
polyadenylation. EST N90240 presente cependant deux 
signaux de polyadenylation putatifs AATAAA situes a 33 et 
59 paires de bases en 3' de l'extremite de la sequence 
consensus proposee. Le premier codon methionine a la 
position 243 et le consensus Kozak qui ie precede sont 
soulignes. Ce codon est en phase avec une sequence 
d'aminoacides putative situee en amont (en italique) . Le 
premier codon de terminaison dans le cadre (position 
2745) est souligne. Le cadre de lecture ouvert 
chevauchant est egalement montre (en italique) et son 
codon de terminaison souligne (position 3638) . La 
sequence de la position 2560 a la position 2880 est 
confirmee par des EST chevauchant (H70616, R00491, 
R10603), ce qui ecarte une mutation artef actuelle du 
cadre de lecture dans le clone DAN1 . 

Un cadre de lecture ouvert commence a la 
position 1 jusqu'a la position 2745. La premiere 
methionine est a la position 243 et est precedee d'une 
tres bonne sequence consensus pour 1' initiation de la 
traduction (accord de 6/9 y compris 1 ' important A a -3). 
La sequence amont est tres riche en GC, ce qui pourrait 
expliquer 1' absence de codons d' arret dans les trois 
cadres de lecture. 

De maniere inattendue, un second cadre de 
lecture ouvert de 348 codons chevauche, dans un cadre 
different, le plus grand cadre de lecture ouvert. La 
probability pour que cela soit le resultat du hasard est 
faible; cela suggere une mutation du cadre de lecture 
dans le clone originel DAN1 . Une comparaison avec la 
sequence de 3 EST chevauchant cette region (positions 
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2560 a 2880) a cependant confirme la sequence du clone 
DAN1 et la presence du codon d 1 arret predit. L'existence 
d'un dephasage du cadre de lecture lors de la traduction 
reste une possibilite . distincte, d'autant plus que le 
programme informatique GRAIL la donne au cadre de lecture 
ouvert 3' un score "excellent" pour sa capacite a coder 
des proteines. Une autre possibilite est l 1 existence 
d'epissages alternatifs produisant diverses formes 
d'ARNm, certaines etant porteuses d'un decalage du cadre 
de lecture (exemple: le gene FMR1 fragile X mental 
retardation 1) . Trois autres EST chevauchant etendent la 
region 3 r non traduite de 177 paires de bases (voir 
figure 7 ) . 

Un fragment DAN1 de 2,5 kb a ete utilise comme 
sonde dans des transferts Northern avec de 1*ARN polyA + 
humain. Une expression ubiquiste a ete trouvee dans 
differentes regions du cerveau et une forte expression a 
ete observee dans d' autres organes. 

En figure 8, est represents une analyse d'un 
transfert Northern. Une sonde de 2,5 kb (de la position 
1370 a 3985 sur la figure 7) a ete utilisee "pour les 
transferts Northern (MTN Clontech® et MTN2 issu de 
cerveau) contenant de i'ARN polyA + humain des regions de 
cerveau et des tissus indiques. La longueur de l'ARNm a 
ete evaluee a 4,4 kb, ce qui est tres proche de la 
sequence de 4,2 kb derivee du DAN1 et chevauchant les 
EST . 

La ou les proteine(s) predite(s) a partir des 
deux cadres de lecture ouverts ne presente (nt) pas 
d'homologie significative avec des proteines connues chez 
les humains ou chez les autres organismes. Le gene 
apparait bien conserve chez les mammiferes (bovins, 
lapins, moutons, cochons et souris) et les poulets comme 
l'indiquent les fragments a fortes reactions croisees 
observes sur transfert Zoo en utilisant les memes sonde 
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d ' ADNc et conditions d • hybridation et de lavage que pour 
1' analyse par transfert Northern. 



. Discussion 

SCA2 est le sixieme locus clone correspondant a 
une maladie ou se trouve impliquee une extension de 
repetitions CAG/polyglutamine . 

Dans la population etudiee, une limite 
inferieure de pathogenicity de 37 glutamines a ete 
trouvee, ce qui est tres proche de la limite de 36 
trouvee chez les tres rares patients atteints de la 
maladie de Huntington. Cette limite n'est pas definitive 
et ne pourra etre etablie que par 1 'etude d'un nombre 
plus eleve de patients. Les limites inferieures pour les 
autres maladies sont respectivement 40, 40, 49 et 61 pour 
SBMA, SCA1, DRPLA et MJD/SCA3 . 

Malgre un seuil de pathogenicite similaire, 
l'effet des glutamines additionnelles apparait plus 
important dans SCA2 que dans HD puisque le declenchement 
juvenile de la maladie (inferieur ou egal a 20 ans) est 
atteint avec 46 repetitions pour SCA2 alors que, pour HD, 
les cas juveniles sont ma j oritairement atteints avec plus 
de 60 repetitions et, pour SCA1, a plus de 55 
repetitions . 

La courbe, tres abrupte, de correlation semble 
plus proche de celle de la maladie de Machado- Joseph 
(SCA3), pour laquelle le seuil de pathogenicite est 
cependant plus eleve. Cela suggere que la proteine 
impliquee dans SCA2 (ataxine 2) est tres sensible aux 
polyglutamines . 

En alternative, cette sensibilite accrue 
pourrait etre une propriete des neurones affectes. 
L' existence d'un effet "contexte proteique" est supporte 
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par le fait que dans la proteins TBP (TATA binding 
protein) , jusqu'a 42 glutamines sont trouvees dans les 
alleles normaux. II est de plus possible que la toxicity 
d'une ataxine troncaturee soit plus elevee que celle de 
la proteine entiere, avec un role protecteur de la partie 
proteique troncaturee . 

Un autre caractere tres frappant chez les 
families SCA2 est la haute instability de la repetition. 
13 des 16 transmissions mettent en evidence une 
instability et 5 d'entre elles, en particulier, 
presentent une augmentation de 5 a 10 repetitions. 

De telles augmentations se produisent dans 20 a 
30% des transmissions paternelles de HD, 

pref e rentieilement chez des alleles parentaux a plus de 
45 glutamines, et sont tres rares, pour SCA1 ou SBMA, 
pour des tailles de repetitions similaires. 

Ces grandes extensions addit ionnelles se 
produisent, de plus, lors de transmissions paternelles et 
maternelles. Ce fait est en bonne correlation avec le 
manque de biais parental dans 1 1 anticipation de SCA2 pour 
laquelle les memes 11-16 annees d ? anticipation de 1 1 age 
de declenchement de la maladie ,ont ete observees 
independamment du sexe du parent transmet tear . 

Le biais paternel pour 1' extension qui est 
observee chez HD, SCA1, DRPLA et aussi chez des 
dystrophies myotoniques (pour des alleles dans la gamme 
des 50-100 CTG) , et, dans une moindre mesure chez SBMA, 
n'est pas une propriety intrinseque des repetitions CAG 
ou CTG. Des effets dus a la position (nature des 
sequences environnantes et localisation de la sequence 
relativement aux origines de replication) pourraient 
jouer un role important dans 1 1 instability . 

Un autre trait du locus SCA2 est 
1 1 interruption, chez les alleles normaux, de la 
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repetition de CAG par 1 a 3 CAA (qui cedent egalement 
pour des glutamines) . 

Les trois alleles pathologiques sequences 
(issus de families differentes) contiennent cependant des 
repetitions purement CAG. Ceci est tres similaire au cas 
de SCA1 pour lequel les alleles normaux sont interrompus 
par des codons CAT (histidine) alors que les alleles 
etendus sont constitues purement de CAG. 

Ces interruptions dans les repetitions 
pourraien: avoir un effet stabilisant et la perte des 
interruptions CAA pourrait constituer un evenement 
initial dans I'histoire de la mutation. 

Comme dans quatre des cinq autres maladies a 
polyglutamine (I 1 exception etant SBMA et le gene du 
recepteur androgene) , le gene SCA2 n'a pas de fonction 
evidente et apparait comme s'exprimant de maniere 
ubiquiste dans le cerveau et cela meme dans des zones 
telles que le putamen qui reste non affecte chez les 
patients . 

La taille apparente de la proteine SCA2 mutante 
est de 150 kDa sur transferts Western mais les chalnes 
etendues de polyglutamines peuvent affecter la migration 
electrophoretique et une taille d'environ 120-130 kDa 
(environ 1100-1200 acides amines) pour I'ataxine 2 
normale peut etre estimee. 

Le cadre de lecture ouvert principal commengant 
au premier codon methionine (caracterise par une tres 
bonne concordance avec le consensus Kozak) , code pour une 
proteine de 834 acides amines et d'un poids moleculaire 
de 89, 9 kDa. 

Pour expliquer un tel ecart, on peut supposer 
que, soit le vrai codon d' initiation est en amont de la 
sequence presentee, soit le cadre de lecture ouvert 3 1 
qui chevauche le cadre principal est utilise par 
dephasage du cadre de lecture lors de la traduction sur 
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les ribosomes. Une troisieme possibility est que les ADN 
sequences correspondent a un epissage alternatif alterant 
la phrase de lecture. Etant donne que la sequence 
presentee (4,2 kb) est tres proche de la longueur d'ARNm 
estimee sur transfert Northern (4,4 kb, polyA inclus), il 
n'y a pas beaucoup de place pour un site d' initiation 
amont additionnel . 

II est done possible qu'un dephasage 
ribosomique du cadre de lecture, qui est observe pour 
plusieurs genes viraux et aussi pour quelques genes 
humains, soit implique. 

Une mutation -1 du cadre de lecture 
correspondrait a une proteine normale de 1132 acides 
amines et de poids moleculaire 121,7 kDa, ce qui est en 
tres bon accord avec le poids moleculaire estime. 

Par analyse informatique de la sequence ARNm, 
des structures secondaires de pseudonoeuds, qui peuven: 
constituer des sequences stimulant les evenements de 
mutation du cadre de lecture, n'ont pu etre mises en 
evidence. La mutation -1 du cadre de lecture telle que 
suggeree ci-dessus ne constitue done qu'une explication 
possible des ecarts de tallies observes. 

La mise en evidence d'un eventuel epissage 
alternatif pourra etre etablie par RT-PCR en utilisant 
des amorces basees sur la sequence de la figure 7 a 
partir d'ARN provenant de divers tissus. 
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LISTE DE SEQUENCES 

(1) INFORMATIONS GENERALES : 
( i ) DEPOSANT : 

(A) NOM: C.N.R.S. 

(B) RUE: 3, rue Michel -Anae 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75016 

(A) NOM: I.N.S.fe.R.M. 

(B) RUE: 101, rue de Tolbiac 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75013 

(ii) TITRE DE L ' INVENTION: Moyens pour le traitement et 
le diagnostic des maladies neurodegeneratives 

(iii) NOMBRE DE SEQUENCES: 6 

(iv) FORME DECHI FFRABLE PAR ORDINATEUR • 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 
^EB? 1 ^ 1 PatentIn Release #1-0, Version #1.30 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 399 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

( ii ) TYPE DE MOLECULE : ADNc 
(iii) HYPOTHETIQUE : NON 

(iv) ANTI-SENS: NON 
(vii) SOURCE IMMEDIATE: 
(B) CLONE: AAD10 

(xi) DESCRIPTION DE LA SEQUENCE • SEO ID NO- 1 

™£££* GCAGC AGCA GCAGCA ACAGCAg£aG CA GNNNNNnS 40 

NNNNNNNNNN NNNNNNNCAG CAGCAACAGC AGCAGNNNNN 80 

NNNNNNNNNN NNNNNNNNNN SSSSnNN 120 

™NNNNNNNN NNNNNNNNNN NNNNNNNNNN 160 

NNNMMMmmmm ™ NNNNNNNN NNNNNNNNNN NNNNNNNNNN 200 

NNNMMmmmZ ™ NNNNNNNN NNNNNNNNNN NNNNNNNNNN 240 

nSnnmmmm mmkT NNNNNN NNN ™NNNNN NNNNNNNNNN 280 

NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 320 

NNNNNNPAPP ™™™ NNNN NNNNNNNNNN NNNNNNNNNN Ho 
NNNNNNCAGC AGCAGCAGCA GCAACAACAG CACCAACAGC 400 



402 



WO 97/17445 



43 



PCT/FR96/01773 



(3) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 152 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(vii) SOURCE IMMEDIATE: 
(B) CLONE: AAD14 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

CAGCAGCAGC AGCAGCAGCA GCAACAGCAG CAGCAGNNNN 40 

NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN 80 

NNNNNNNNNN NNNNNNNNNN NNNNNNNNNN NCAGCAGCAG 120 

CAGCAGCAGC AGCAGCAGCA GCAGCAGCAG CAG 153 



(4) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 66 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

-(vii) SOURCE IMMEDIATE: 
(B) CLONE: DAN1 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

CAGCAGCAGC AGCAGCAGCA GCAGCAACAG CAGCAGCAGC 40 
AACAGCAGCA GCAGCAGCAG CAGCAG 66 



(5) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 54 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 
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(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 

(iv) ANTI-SENS: NON 
(vii) SOURCE IMMEDIATE: 
(B) CLONE: DAN15 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

CAGCAGCAGC AGCAGCAGCA GCAACAGCAG CAGCAGCAGC 40 

AGCAGCAACA GCAA 54 

(6) INFORMATIONS POUR LA SEQ ID NO: 5: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 



(vii) SOURCE IMMEDIATE: 
(B) CLONE: DAN26 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
CAGCAGCAGC AGCAGCAGCA ACAGCAGCAG CAGCAG 
(7) INFORMATIONS POUR LA SEQ ID NO: 6: 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 42 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: des deux 

(ii) TYPE DE MOLECULE: ADNc 
( iii ) HYPOTHETIQUE : NON 
(iv) ANTI-SENS: NON 



(vii) SOURCE IMMEDIATE: 
(B) CLONE: AAD20 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CAGCAGCAGC AGCAGCAGCA GCAGCAGCAG CAGCAGCAGC AG 
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(8) INFORMATIONS POUR LA SEQ ID NO: 7: 

fi) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 199 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

( D) CONFIGURATION: des deux 

{iii TYPE DE MOLECULE: ADNc 
(iii) HYPOTHETIQUE: NON 
(iv) ANTI-SENS: NON 

(vii) SOURCE IMMEDIATE: 
(B) CLONE: DAN1 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

ACGGCAACGG CGGCGGCGCG TTTCGGCCCG GCTCCCGGCG GCTCCTTGGT CTCGGCGGGC 60 

CTCCCCGCCC CTTCGTCGTC GTCCTTCTCC CCCTCGCCAG CCCGGGCGCC CCTCCGGCCG 120 

CGCCAACCCG CGCCTCCCCG CTCGGCGCCC GTGCGTCCCC GCCGCGTTCC GGCGTCTCCT 180 

TGGCGCGCCC GGCTCCCGGC TGTCCCCGCC CGGCGTGCGA GCCGGTGTAT GGGCCCCTCA 24 0 

CCATGTCGCT GAAGCCCCAG CAGCAGCAGC AGCAGCAGCA GCAACAGCAG CAGCAGCAAC 300 

AGCAG C AG C A GCAGCAGCAG CAGCCGCCGC CCGCGGCTGC CAATGTCCGC AAGCCCGGCG 360 

GCAGCGGCCT TCTAGCGTCG CCCGCCGCCG CGCCTTCGCC GTCCTCGTCC TCGGTCTCCT 4 20 

CGTCCTCGGC CACGGCTCCC TCCTCGGTGG TCGCGGCGAC CTCCGGCGGC GGGAGGCCCG 4 80 

GCCTGGGCAG AGGTCGAAAC AGTAACAAAG GACTGCCTCA GTCTACGATT TCTTTTGATG 54 0 

GAATCTATGC AAATATGAGG ATGGTTCATA TACTTACATC AGTTGTTGGC TCCAAATGTG 600 

AAGTACAAGT GAAAAATGGA GGT AT AT AT G AAGGAGTTTT TAAAACTTAC AGTCCGAAGT 660 

GTGATTTGGT ACTTGATGCC GCACATGAGA AAAGTACAGA ATCCAGTTCG GGGCCGAAAC 720 

GTGAAGAAAT AAT GGAGAGT ATTTTGTTCA AATGTTCAGA CTTTGTTGTG GTACAGTTTA 7 80 

AAGATATGGA CTCCAGTTAT GCAAAAAGAG ATGCTTTTAC TGACTCTGCT ATCAGTGCTA 84 0 

AAGTGAATGG CGAACACAAA GAGAAGGACC TGGAGCCCTG GGATGCAGGT GAACTCACAG 9 00 

CCAATGAGGA ACTTGAGGCT TTGGAAAATG AC GTAT CTAA TGGATGGGAT CCCAATGATA 960 

TGTTTCGATA TAATGAAGAA AATTATGGTG TAGTGTCTAC GTAT GAT AGC AGTTTATCTT 102 0 

CGTATACAGT GCCCTTAGAA AGAGATAACT CAGAAGAATT TTTAAAACGG GAAGCAAGGG 1080 

CAAAC CAGTT AGCAGAAGAA ATTGAGTCAA GTGCCCAGTA CAAAGCTCGA GTGGCCCTGG 114 0 

AAAATGATGA TAGGAGTGAG GAAGAAAAAT ACACAGCAGT TCAGAGAAAT TCCAGTGAAC 1200 

GTGAGGGGCA CAGCATAAAC ACTAGGGAAA ATAAATATAT TCCTCCTGGA CAAAGAAATA ..1260 
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GAGAAGT CAT ATCCTGGGGA AGTGGGAGAC AGAATTCACC GCGTATGGGC CAGCCTGGAT 1320 

CGGGCTCCAT GCCATCAAGA TCCACTTCTC ACACTTCAGA TTTCAACCCG AATTCTGGTT 1380 

CAGACCAAAG AGTAGTTAAT GGAGGTGTTC CCTGGCCATC GCCTTGCCCA TCTCCTTCCT 1440 

CTCGCCCACC TTCTCGCTAC CAGTCAGGTC CCAACTCTCT TCCACCTCGG GCAGCCACCC 1500 

CTACACGGCC GCCCTCCAGG CCCCCCTCGC GGCCATCCAG ACCCCCGTCT CACCCCTCTG 1560 

CTCATGGTTC TCCAGCTCCT GTCTCTACTA TGCCTAAACG CATGTCTTCA GAAGGGCCTC 1620 

CAAGGATGTC CCCAAAGGCC CAGCGACATC CTCGAAATCA CAGAGTTTCT GCTGGGAGGG 1680 

GTTCCATATC CAGTGGCCTA GAATTTGTAT CCCACAACCC AC CCAGT GAA GCAGCTACTC 174 0 

CTCCAGTAGC AAGGACCAGT CCCTCGGGGG GAACGTGGTC ATCAGTGGTC AGTGGGGTTC 1800 

CAAGATTATC CCCTAAAACT CATAGACCCA GGTCTCCCAG ACAGAACAGT ATTGGAAATA I860 

CCCCCAGTGG GCCAGTTCTT GCTTCTCCCC AAGCTGGTAT TATTCCAACT GAAGCTGTTG 1920 

C CATGC CT AT TCCAGCTGCA TCTCCTACGC CTGCTAGTCC TGCATCGAAC AGAGCTGTTA I960 

CCCCTTCTAG TGAGGCTAAA GATTCCAGGC TTCAAGATCA GAGGCAGAAC TCTCCTGCAG 204 0 

GGAATAAAGA AAATATTAAA CCCAATGAAA CATCACCTAG CTTCTCAAAA GCTGAAAACA 2100 

AAGGT AT AT C ACCAGTTGTT TCTGAACATA GAAAACAGAT T GATGATTT A AAGAAATTTA 2160 

AGAATGATTT TAGGTTACAG CCAAGTTCTA CTTCTGAATC TATGGATCAA CTACTAAACA 2220 

AAAATAGAGA GGGAGAAAAA TCAAGAGATT TGATCAAAGA CAAAATTGAA CCAAGTGCTA 22 80 

AGGATTCTTT CATTGAAAAT AGCAGCAGCA ACTGTACCAG TGGCAGCAGC AAGCCGAATA 2340 

GCCCCAGCAT TTCCCCTTCA ATACTTAGTA ACAC GGAGCA CAAGAGGGGA CCTGAGGTCA 2400 

CTTCCCAAGG GGTTCAGACT TCCAGCCCAG CAT GTAAACA AGAGAAAGAC GATAAGGAAG 2 4 60 

AGAAGAAAGA CGCAGCTGAG CAAGTTAGGA AATCAACATT GAATCCCAAT GCAAAGGAGT 2520 

TCAACCCACG TTCCTTCTCT CAGCCAAAGC CTTCTACTAC CCCAACTTCA CCTCGGCCTC 2580 

AAGCACAACC TAGCCCATCT ATGGTGGGTC ATCAACAGCC AACTCCAGTT TAT ACT CAGC 2 640 

CTGTTTGTTT TGCACCAAAT ATGATGTATC CAGTCCCAGT GAGCCCAGGC GTGCAATACC 2700 

AAATATGCCC CAACAGCGGC AAGACCAGCA TCATCAGAGT GCCATGATGC ACCCAGCGTC 2760 

AGCAGCGGGC CCACCGATTG CAGCCACCCC AC CAGCTTAC TCCACGCAAT ATGTTGCCTA 2820 

CAGTCCTCAG CAGTTCCCAA ATCAGCCCCT TGTTCAGCAT GTGCCACATT ATCAGTCTCA 2880 

GCATCCTCAT GTCTATAGTC CTGTAATACA GGGTAATGCT AGAATGATGG CACCACCAAC 2940 

ACACGCCCAG CCTGGTTTAG TATCTTCTTC AGCAACTCAG TACGGGGCTC ATGAGCAGAC 3000 

GCATGCGATG TATGCATGTC CCAAATTACC ATACAACAAG GAGACAAGCC CTTCTTTCTA 3060 

CTTTGCCATT TCCACGGGCT CCCTTGCTCA GCAGTATGCG CACCCTAACG CTACCCTGCA 3120 

CCCACATACT CCACACCCTC AGCCTTCAGC TACCCCCACT GGACAGCAGC AAAGCCAACA 3180 
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TGGTGGAAGT CATCCTGCAC CCAGTCCTGT TCAGCACCAT CAGCACCAGG CCGCCCAGGC 324 0 

TCTCCATCTG GCCAGTCCAC AGCAGCAGTC AGCCATTTAC CACGCGGGGC TTGCGCCAAC 3300 

TCCACCCTCC ATGACACCTG CCTCCAACAC GCAGTCGCCA CAGAATAGTT TCCCAGCAGC 3360 

ACAACAGACT GTCTTTACGA TCCATCCTTC TCACGTTCAG CCGGCGTATA CCAACCCACC 3420 

CCACATGGCC CACGTACCTC AGGCTCATGT ACAGT CAGGA ATGGTTCCTT CTCATCCAAC 34 80 

TGCCCATGCG CCAATGATGC TAATGACGAC ACAGCCACCC GGCGGTCCCC AGGCCGCCCT 3540 

CGCTCAAAGTG CACTACAGCC CATTCCAGTC T C GACAACAG CGCATTTCCC CTATATGACG 3 600 

CACCCTTCAG TACAAGCCCA CCACCAACAG CAGTTGTAAG GCTGCCCTGG AGGAACCGAA 3660 

AGGCCAAATT CCCTCCTCCC TTCTACTGCT TCTACCAACT GGAAGCACAG AAAACTAGAA 3720 

TTTCATTTAT TTTGTTTTTA AAATATATAT GTTGATT7CT TGTAACATCC AATAGGAATG 37 8 0 

CTAACAGTTC ACTTGCAGTG GAAGAT ACT T GGACCGAGTA GAGGCATTTA GGAACTTGGG 384 0 

GGCTATTCCA TAATTCCATA TGCTGTTTCA GAGTCCCGCA GGTACCCCAG CTCTGCTTGC 3900 

CGAAACTGGA AGTTATTTAT TTTTTAATAA CCCTTGAAAG TCATGAACAC ATCAGCTAGC 3 960 

AAAAGAAGTA ACAAGAGTGA TTCTTGCTGC TATTACTGCT AAAAAAAAAA AAAAAAAAAA 4 02 0 

AaaaaaaaTC AAGACTTGGA - ACGCCCTTTT ACTAAACTTG ACAAAGTTTC AGTAAATTCT 4080 

TACCGTCAAA CTGACGGATT ATTATTTATA AATCAAGTTT GATGAGGTGA TCACTGTCTA 4140 

CAGTGGTTCA ACTTTTAAGT TAAGGGAAAA ACTTTTACTT TGTAGATAAT ATAAAATCC 4199 
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REVENDICATIONS 



1. Utilisation de l'anticorps 1C2 ou d'un 
fragment ou d'un derive de l'anticorps 1C2 pour la 
preparation d'une composicion pharmaceutique destinee au 
traitement preventif ou curatif des maladies 
neurodegeneratives aasociees a une repetition de 
glutamine . 

2. Utilisation selon la revendication : 
caracterisee en ce qu'elle met en oeuvre l'anticorps 1C2 . 

3. Utilisation selon la revendication 1 
caracterisee en ce qu'elle met en oeuvre un fragment ScFv 
de l'anticorps 1C2 . 

4. Utilisation d'un acide nucleique codant pour 
15 un fragment ScFv de l'anticorps 1C2 pour la preparation 

d'une composition pharmaceutique destinee au traitement 
preventif ou curatif des maladies neurodegeneratives 
associees a une repetition de glutamine. 

5. Utilisation selon l'une guelconque des 
20 revendications 1 a 4 pour ie traitement des maladies 

telles que par exemple la maladie de Huntington, l'ataxie 
spinocerebelleuse de type 1, 2, 3, 4, 5 ou 7, i' atrophic 
muscuiaire spino-bulbaire associee au chromosome X ou 
maladie de Kennedy, 1'atrophie dentarorubral- 
paliidoluysienne, l'ataxie spinocerebelleuse autosomale 
dominante, et la paraplegie spastique familiale, ou 
encore la maladie affective bipolaire, la psychose 
maniaco-depressive ou la schizophrenie . 

6. Molecule comprenant le site de liaison de la 
30 region variable de la chaine legere de l'anticorps 1C2 

relie par un bras peptidique au site de liaison de la 
region variable de la chaine lourde ce l'anticorps 1C2. 

7. Sequence d' acide nucleique caracterisee en 
ce qu'elle code pour la molecule selon la revendication 

35 6. 
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8. Vecteur comprenant ia sequence selon la 
revendication 7 sous controle d'un promoteur fonctionnel 
dans les cellules de mainmif eres . 

9. Vecteur selon la revendication 8 caracterise 
5 en ce qu'il s'agit d'un adenovirus recombinant defectif. 

10. Vecteur selon la revendication 8 
caracterise en ce qu'il s'agit d'un retrovirus 
recombinant defectif. 

11. Vecteur selon la revendication 8 
10 caracterise en ce qu'il s'agit d'un virus adeno associe 

recombinant defectif . 

12. Vecteur selon ia revendication 8 
caracterise en ce qu'il s'agit du virus de 1 'herpes 
recombinant defectif . 

15 13. Composition pharmaceutique comprenant 

1'anticorps 1C2, un fragment ou derive de cet anticorps. 

14. Composition pharmaceutique comprenant un 
vecteur selon l'une quelconque des revendications 8 a 12. 

15. Composition pharmaceutique destinee au 
20 traitement des maladies neurodegeneratives associees a la 

presence d'une proteine portant une chaine homopolymere 
de glutamine caracterisee en ce qu'eile comprend 
i' anticorps 1C2, un fragment ou derive de cet anticorps, 
notamment selon la revendication 6, ou un vecteur selon 
25 l'une quelconque des revendications 8 a 12. 

16. Methode de diagnostic des maladies 
neurodegeneratives caracterisee en ce que I'cn detecte in 
vitro , au moyen de 1'anticorps 1C2, a un fragment ou 
d'un derive de 1'anticorps 1C2 la presence de proteines 

30 portant une chaine polyglutamine de longueur 
pathologique . 

17. Methode selon revendication 16 caracterisee 
en ce que la detection de ces proteines est realisee par 
mise en contact d'un extrait cellulaire avec 1'anticorps, - 
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monoclonal 1C2 er revelation des complexes anticorps- 
antigenes formes. 

18. Methode selon 1 ' une des revendications 16 
ou 17 caracterisee en ce que la detection esc realisee 

5 sur un extrait de cellules sanguines. 

19. Methode selon l'une queiconque des 
revendications 16 a 18 pour la mise en evidence de 
predisposition a la maladie de Huntington ou a une ataxie 
spinocerebelleule 1, 2 ou 3. 

10 20 * Methode selon l'une queiconque des 

revendications precedentes 16 a 18 pour la mise en 
evidence de maladies degeneratives du systeme nerveux 
central causees par la presence d'une chaine 
polyglutamine dans une proteine exprimee. 

21. ADN caracterise en ce qu'il comporte tout 
ou partie d'au moins une des sequences SEQ ID n°l, n°2, 
n 3, n°4, n°5, n°6, n°7 ou d'au moins une sequence 
presentant une homologie superieure ou egale a 50% avec 
ces sequences. 

22. Les ARN correspondant a la transcription 
d'au moins un ADN selon la revendication 21, les 
sequences complementaires de ces ADN ou ARN, ou ieurs 
sequences anti-sens . 

23. Procede de criblage d 1 expression d 1 ADNs a 
25 repetition CAG ou de leurs produits d ? expression 

caracterise en ce qu'il comprend 1 ' utilisation de 
I'-anticorps 1C2 ou d'un fragment ou d'un derive de cet 
anticorps . 

24. Procede d 1 identification ou de purification 
30 de proteines a chaines polyglutaminiques utilisant une 

etape d f immunodetection ou d ' immunopurif ication par 
1' anticorps 1C2, fragment ou derive de cet anticorps, ou 
pouvant conduire secondairement a identifier le gene 
correspondant . 
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25. Methode de diagnostic utilisant 
1 'amplification PCR sur ADN ou RT-PCR sur ARN permettant 
de detecter des formes mutees dans des genes codant pour 
des chaines polyglutaminiques idencifiees ou donees 
5 grace a l'anticorps 1C2 . 
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Figure 3 
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figure 7 

C V a C C A ? P C 5 R 1 L l C L Z G ? ? R " V" r" *y 

A S P ? R J O V 3~A3?A?GC?3?£C£?y 

2 2 6 ~STATGCCCCCCT^C£A^^CCCTGAAGCCCCA t q q 

3 0 1 AGCAGCAGCACCACCACCACCACCCGCCCCCCGCGCC^^ . . . 

Q^Q Q Q Q Q Q P P PAAANVRKPGG SG L T A 

376 CCTCKCCCCCCCCCCGCCTT^ 

S P A A A ? S ? S S S S V S S S S A 7 A ? S S 7^ 

4 51 TCCCGCCCACCTCCGCCG<X:CGGACGCCCGGC c 

AATSGGGRPGLGRGRNSNXGLPCS^T 

52 6 CGATTTCTTTTGATGCAATCTATGCJLAATATG^ 600 
I S ? DGI YANMRMVH XI-TSVVGSKC£ 

€01 AAGTACAAGTGAAAAATtSGACOT^^ fi75 
VQVKNGGI YEGVFKTYSP KCDLVLD 

67 6 ATGCOTCACAT^GAAAAGTACAGAATCCACTTCGOG^ 75Q 
AAH EKSTESSSGPKREEIMESILFK 

751 AATGTTCACACTTTG^TIOTrACA^ 825 
CSDFVVVQFKDMOSSYAKRDAFTDS 

82 6 CTCCTATCACTGCTAAAffTGAAT^ 9 0 Q 
AISAKVNCEHKBKDLB PWDACELTA 

NHBLBALENDVSNGWDPNDMFRYNB 
97 6 AACAAAATTATGCTGTAGTGTCTAOT^ 1050 
ENYGVVSTYDSSLSSYTVPLBRONS 

1051 CAGAAGAATTXTTAAAACGGGAAGCAAGG^ 1125 
EEPLKREARANQLAEEIESSAQYKA 

1126 CTCGAGTGC€ ^^ 1200 
RVALBNDDRSEBEKYTAVQRNSSER 

1201 GTGAGGgGCACAGCATAAACACTAGCGAAAATAAATATAlTC CTC CT G GACAAAGJLAATAGAGAAGTCATATCCT 1275 
EGH SINTRBNKYIPPGQRNREVISW 

127 6 GCGCAAX*rGCGAGACAGAATTCACCGCCTATGGGCCAGC CTGGATCGGGCTCCATGCCATCAAGATC CACTTCTC 1350 
GSGRQNSPRMGQPGSGSKPSRSTSH 

13 51 ACACTTCAGATTTCAACCCGAATTCTGGTTCAGACCAAAGAGTAGTTA^ 142 S 
TS DFNPNSGSDQRVVNGGVPWPSPC 

142 6 GCCCATCTCClUV^'iVlXJCCCCACCTTCTC^ x 5 Q Q 

ps ps.srppsryqscpns'lppraatp 

1501 CTACACCCCCKCCTCCACKCCCCC^ ,5,5 
TR P^PSRPPSRPSRPPS HPSAHGSPA 

1576 CTCCTCTCTCTACTATCCC^ 1650 
PVSTMPKRMSSEGPPRMSPKA QRH f>' 

1651 C-CGAAATCACAGAGTTTCTGCTGGGACGG^ 

RNHRVSAGRGS ISSCLEF. VSHN? PS 
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figure 7 (suite 2 et fin) 

3 j T 4 "^CSATCCATCrrTCTCACCTTCACCCC^CGTATACCAACCCACCCCACATCCCCCACCTACrTCAGCCTCATCT 2 4 50 
TZHPSHVQPA Y T N ? ? H M A H 7 J A V 

2 4 51 ACAGTCAGGAATCCTTC C TTC"IX^ATCCAACTGCCCATCCGCCAATCATGCTAA7GACGACACAGCC\CCCCGCGC 3 5 2 < 

QSCHVPSHP7AHA PtiML>STTQ??GG 

3 52 6 TCCCCACGCCCCCCTCGCTCAAAGTGCACTAC^GCCCA 3 600 

PQAALAQSALQPIPVSTTAHTPrXT 

3 601 GCACCCTTCACTACAAGCCCACCACCA^CAGCA^^ 3 fi7 <. 

3 67 6 C~CCCTTCTACTGCTTCTACCAACTGCA 3 ? 5Q 

3751 TGTTGArrrCTTCrrAACATCCAATAC^AATGCTAA 3825 



3900 



3 82 6 CATTTAGGAACTTCGGGGCTATTCCATAATTCCATATGCTGTTTCAGAGTCCCGCAGG 

3 901 CCGAAACTGGAAGTT ATTTATTTTTT AATAACC CTTCAAAGTCATGAACAC A7CACCT AGCAAAAGAAGTAACAA 3 975 

3 97 6 GACTGATTCTTGC7CCTA TTACTGCTAAAAAAAAAAAAAAAAAAAAA&a&aaa a TCAAGACTTGGAACGCCCTTT 4 050 

4051 'ACTAAACTTGACAAAGTTTCAGTAJ^TTCT^ 4 125 

4126 AGGTGATCA CTGTCTA CA GTGGTTCAA CTTTTAAGTTA 4163 
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